期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于预定义类的紧凑型正则表达式匹配算法
麦涛涛, 潘晓中, 王亚奇, 苏阳
计算机应用    2017, 37 (2): 397-401.   DOI: 10.11772/j.issn.1001-9081.2017.02.0397
摘要491)      PDF (937KB)(527)    收藏
针对目前硬件正则表达式匹配算法在存储空间以及吞吐量等方面面临的挑战,结合扩展有限自动机(XFA)正则表达式匹配算法,提出了一种预定义类的压缩自动机匹配算法(Pre-Class CFA)。通过预定义类,算法既可以实现正则表达式中类字符匹配,又能够通过优先级的设定匹配特殊字符集,并在XFA消除确定性有限状态机(DFA)状态爆炸问题的基础上进一步压缩了迁移边数目;同时算法根据现场可编程门阵列(FPGA)和迁移边的特征,设计了一种基于并联只读存储器(ROM)结构的迁移边存取方法,可以实现同一状态多条迁移边的并行读取和匹配。在中低性能FPGA平台ALTERA DE2-70上对算法进行测试,实验中系统吞吐量为1.3 Gb/s,可实现千兆网络下的入侵检测和垃圾过滤。
参考文献 | 相关文章 | 多维度评价
2. 基于自监督学习的维基百科家庭关系抽取
朱苏阳, 惠浩添, 钱龙华, 张民
计算机应用    2015, 35 (4): 1013-1016.   DOI: 10.11772/j.issn.1001-9081.2015.04.1013
摘要520)      PDF (773KB)(665)    收藏

传统有监督的关系抽取方法需要大量人工标注的训练语料,而半监督方法则召回率较低,对此提出了一种基于自监督学习来抽取人物家庭关系的方法。该方法首先将中文维基百科的半结构化信息——家庭关系三元组映射到自由文本中,从而自动生成已标注的训练语料;然后,使用基于特征的关系抽取方法从中文维基百科的文本中获取人物间的家庭关系。在一个人工标注的家庭关系网络测试集上的实验结果表明,该方法优于自举方法,其F1指数达到77%,说明自监督学习可以较为有效地抽取人物家庭关系。

参考文献 | 相关文章 | 多维度评价